C++正则表达式

您所在的位置:网站首页 c++ 字符串匹配 C++正则表达式

C++正则表达式

#C++正则表达式| 来源: 网络整理| 查看: 265

目录C++正则总述ECMAScript支持的正则具有特殊意义的元字符量词元字符C++支持的正则C++使用正则匹配与否捕获更高级的捕捉捕捉的同时生成新串参考资料

转载请说明出处。

C++正则 总述

正则是一种规则,它用来匹配(进而捕获、替换)字符串。这种规则需要“模式”、“字符串”这两样东西,“模式”根据正则规则,来处理“字符串”。

这种规则被许多语言支持,C++11以后才支持正则。

C++11支持的正则和其他语言支持的正则有区别,本篇记录的目的不在于讲解正则,也不在于阐述C++11支持的正则详细是什么,而是只记下常见的、够用的正则规则(以供速查,应有不严谨之处)及使用用法。

ECMAScript支持的正则

正则由元字符和普通字符组成。普通字符就代表它原本的含义;元字符的意义不同于该字符本来的含义,而是有特殊的意义和功能。

根据其意义功能划分,可将元字符划分为:

具有特殊意义的元字符

\:\字符能够改变字符原本的含义

^:^字符指示字符串的头,且要求字符串以字符开头,不占位。\^表示一个真正的^符号。

$:$字符指示字符串的尾,且要求字符串以字符结尾,不占位。\$表示一个真正的$符号。

():分组,大正则中包含小正则。可以改变默认的优先级。在模式中可以使用\1来表示第一组已然捕获到的东西。

\b:指示字符串的边界(头/尾/空格左/空格右),字符\b要求边界的左边是字符,\b字符要求边界的右边是字符。

.:表示一个除了\n以外的任意一个字符。\.表示一个真正的.符号。

|:字符串1|字符串2表示一个字符串,该字符串是字符串1、字符串2中的一个。|在正则中的优先级比较混乱,所以建议加上足够多的括号来分组。

[]:[字符1字符2字符3...]表示一个字符,该字符是字符1、字符2、字符3……中的某一个。中括号中出现的所有字符都是代表本身意思的字符(没有特殊含义),如[.]只能匹配.符号,而不能匹配任意符号。

[^字符1字符2字符3...]表示一个字符,该字符不是字符1、字符2、字符3……中的任何一个

[a-z]表示一个字符,该字符是a、b、c……z中的某一个

[^a-z]表示一个字符,该字符不是a、b、c……z中的任何一个

\w:表示一个字符,该字符是数字、字母、下划线中的某一个。等价于[(0-9)(a-z)(A-Z)(_)]

\W:表示一个字符,该字符不是数字、字母、下划线中的任何一个。等价于[]

\d表示一个字符,该字符是0、1、2……9中的某一个

\D表示一个字符,该字符不是0、1、2……9中的任何一个

\s表示一个字符,该字符是空白符(空格、制表符、换页符)2、代表出现次数的

量词元字符

*:字符*要求字符出现0到多次

+:字符+要求字符出现1到多次

?:字符?要求字符出现0次或1次

{n}:字符{n}要求字符出现n次

{n,}:字符{n,}要求字符出现n到多次

{n,m}:字符{n,m}要求字符出现n到m次、

C++支持的正则

C++可以支持ECMAScript支持的正则,也可以支持grep支持的正则等等。

由于我本人较熟悉ECMAScript支持的正则,且C++默认支持的即是它,所以我接下来讲的也是这种正则。

首先要举一个例子解释一下,

/**在ECMAScript中写一个匹配11位电话号码的正则模式是这样写的**/ var r = /\d{1, 11}/; /**在C++中写一个匹配11位电话号码的正则模式是这样写的**/ regex r("\\d{1, 11}")

看似不一样,其实是一样的,因为传递给regex构造函数的参数是一个字符串,该字符串被C++编译器解析时,将\\解释为真正的\(由于C++中的字符\是转义字符),解析出来的\和紧随其后的d组合,形成了真正的\d,表示一个数字字符。

所以含有\的元字符,在C++定义时,都要写成\\。

C++使用正则 匹配与否

头文件中的regex_match和regex_search均可以进行匹配,返回一个布尔类型,匹配成功为true,匹配失败为false。

不同点:前者要求完全匹配,后者要求子串匹配即可;

下面以regex_match为例,regex_search的写法与之相同,故不赘述。

string str = "hhh233"; regex r("[a-z0-9]+"); // 用法一 bool flag = regex_match(str,r); // 用法二 bool flag = regex_match(str,regex("\\d+")); // 用法三 bool flag = regex_match(str.begin()+7,str.end(),regex("\\d+")); 捕获

捕获就是先匹配,然后将匹配结果存储下来。捕获同样是使用上面介绍的那两个函数,仍然区分为整串匹配和子串匹配。

捕获的步骤:

模式中一般要有分组(因为捕捉的正是分组匹配的结果) 定义一个STL容器smatch,用来保存捕捉的结果 使用reg_search函数匹配,用smatch的实例存储匹配的结果,即完成捕捉。 使用m.size(),查看捕捉到的个数;使用m.str(i),查看捕捉到的字符串;【注意:m.str(0)一定是整个正则匹配到的部分,m.str(1)及以后才是分组捕获的结果】 m.prefix().str()获取整个匹配之前的字符串;m.suffix().str()获取整个匹配之后的字符串

代码:

#include using namespace std; int main() { string str; while(true){ cin >> str; regex e("([[:w:]]+)@([[:w:]]+)\.com"); smatch m; bool found = regex_search(str, m, e); if(found) { cout


【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3